18 research outputs found

    MinION nanopore sequencing and assembly of a complete human papillomavirus genome: bioinformatics pipeline

    Full text link
    A pipeline developed to analyse MinION sequencing data for the reconstruction of viral genome

    Nouvelles stratégies pour l'identification et la caractérisation génomique complète de types inconnus d'HPV à partir d'échantillons d'ADN humain

    No full text
    Human papillomaviruses (HPV) are small non-enveloped icosahedral viruses with double-stranded circular DNA. More than 200 different human papillomaviruses have been identified so far. The classification of the papillomaviridae family is based on pairwise nucleotide sequence identity across the L1 ORF, as it is well conserved and can allowa genome-based approach to PV classification. The discovery of new HPVs is of paramount importance to expand our knowledge on the role of these viruses in human diseases. In particular, while a subgroup of alphapapillomaviruses, referred to as high-risk HPV types, have been related to anogenital cancer and a subset of head and neck cancers, less is known about the role of HPVs from the other genera, such as beta and gamma types, in human cancers. Recent studies show a potential role of betapapillomaviruses in cutaneous squamous cell carcinoma (cSCC) together with ultraviolet (UV) radiation, but further studies are required. The methods used so far for the identification of novel HPVs in human specimens are based on PCR and Sanger sequencing, and several specific and broad-spectrum PCR primers, targeting the L1 ORF, have been designed for the amplification of HPV sequences. Nowadays, with the advent of high-throughput sequencing methods (i.e., NGS, ONT), we can expand this viral family with a more straightforward approach. Additionally, the large amount of data, generated by these new sequencing methods, requires the development of specific bioinformatics analyses for the identification and reconstruction of the viral sequences. The aim of this work was the development of an effective strategy for the identification and full genomic characterization of novel HPV types in human samples. In this work, known and new broad-spectrum PCR primers, all targeting a portion of the HPV L1 ORF, were used to amplify the HPV sequence on human skin (n=119) and oral (n=147) samples from healthy individuals. After, NGS analysis allowed the identification of 105 putative novel HPV types in addition to 296 known types. A specific workflow was developed to analyze the NGS sequencing data. In the second step of this work, starting from the NGS data, the whole genome of HPV227, a novel beta-2 papillomavirus, was obtained using a primer-walking strategy and Sanger sequencing. Finally, the MinION sequencing technology was used to obtain the whole genome of HPV227, directly from the original skin sample where this virus was discovered. A bioinformatics analysis was developed for the reconstruction of HPV genomes using MinION sequencing data. The entire genome of HPV227 was reconstructed, confirming the effectiveness of this strategy. Overall, this thesis describes a valid approach for the identification and full characterization of novel HPV genomes. Moreover, the discovery of 105 putative novel PV types expands our knowledge on this family of viruses, although further analyses are required for a complete characterization of these new virusesLes papillomavirus humains (HPV) sont de petits virus icosaédriques non-enveloppés à ADN circulaire double brin. À ce jour, plus de 200 HPV ont été identifiés. La classification des Papillomaviridae est basée sur les identités de séquence nucléotidique du gène L1. La découverte de nouveaux HPV est d'une importance cruciale pour élargir nos connaissances sur ces virus. Alors qu'un sous-groupe HPV du genre alpha communément appelé "à haut risque", a été clairement associé aux cancers anogénitaux, et à certains cancers de la tête et du cou, il existe peu d’informations sur le rôle des HPV des genres bêta et gamma-HPVs dans les cancers humains. Des études récentes montrent que des bêta-HPVs pourraient jouer un rôle dans les cancers de la peau de type non-mélanome (NMSC), en association avec le rayonnement ultraviolet (UV). Toutefois, des études supplémentaires sont nécessaires pour confirmer cette hypothèse chez l’homme. Jusqu’à présent, les méthodes de choix utilisées pour l'identification de nouveaux HPVs dans des échantillons humains reposaient sur l’utilisation de la PCR et le séquençage de Sanger. Plusieurs amorces spécifiques ou à large spectre ciblant le gène L1, ont été développées pour l'amplification de séquences de HPV. De nos jours, avec l'avènement des méthodes de séquençage à haut débit (NGS), la possibilité d’élargir ces familles virales s’est accrue. Cependant, de grandes quantités de données sont générées par ces nouvelles méthodes de séquençage nécessitant le développement de méthodes bioinformatiques d'analyse spécifiques pour une identification et une reconstruction efficaces des séquences virales. Le but de ce travail de thèse a été de développer une stratégie pour l'identification des HPV, ainsi que la caractérisation du génome complet de nouveaux types, dans des échantillons humains. Au cours de ce travail de thèse, l’utilisation d’amorces à large spectre connues et validées, mais aussi l’utilisation d’amorces améliorées par notre laboratoire, toutes ciblant une portion du gène L1, ont été utilisées pour la recherche de séquences HPV dans des échantillons cutanés et oraux. L'analyse des données NGS a permis l'identification de 105 possible nouvelles séquences de PVs, ainsi que l’identification de 296 HPV connus. Une méthode d’analyse bioinformatique a été développée pour l’analyse des données de séquençage. La deuxième partie de ma thèse a consisté, à partir des données NGS précédemment obtenues, d’obtenir le génome entier de plusieurs HPVs. Ainsi, le génome entier de HPV227, un nouveau bêta-HPV, a été obtenu, en combinant plusieurs méthodes c.à.d. l'amplification par cercle roulant (ou rolling circle amplification - RCA), PCR pour amplification de longs fragments (ou “Long Range PCR”), le séquençage de Sanger par “primer walking”, et le clonage. Enfin, la technologie de séquençage par nanopores (MinION, Oxford Nanopore Technologies) a été utilisée afin d’obtenir le génome entier du HPV227, directement à partir de l'échantillon cutané d'origine et ainsi permettre un gain de temps important dans la caractérisation du génome complet des HPV. Pour ce faire, une méthode d’analyse bioinformatique des données de séquençage MinION pour la reconstruction des génomes de HPV a été développée. L'ensemble du génome du HPV227 a été reconstruit, confirmant l'efficacité de cette stratégie. Dans l'ensemble, cette thèse décrit et valide plusieurs approches pour l'identification et la caractérisation complète de nouveaux génomes de HPV. De plus, la découverte de 105 possible nouveaux PVs élargit nos connaissances sur cette famille de virus, bien que pour des analyses supplémentaires soient nécessaires pour la caractérisation complète de ces nouveaux viru

    DraftPolisher

    Full text link
    DraftPolisher can produce an improved consensus sequence for a draft genome assembly (or any draft sequence assembly) by using a reference genome and a reference database of sequences (by which the frequences of a defined k-mer, representative of each mismatch, will be evaluated) both in FASTA format

    MinION nanopore sequencing and assembly of a complete human papillomavirus genome

    Full text link
    BACKGROUND: The MinION sequencer belongs to the third generation of sequencing technology that allows for the generation of ultra-long reads, representing a potentially more effective approach to characterize entire viral genome sequences than other time-consuming and low-throughput methodologies. METHODS: We report the use of the MinION nanopore sequencer to sequence the full-length genome of human papillomavirus (HPV)-ICB2 (7441 bp), which was previously characterized in our laboratory. Three independent MinION libraries were prepared and sequenced using either three consecutive 12 -h runs (Protocol A) or a single run of 48 h starting from a pool of three barcoded DNA libraries (Protocol B). A fully automated bioinformatics pipeline was developed for the reconstruction of the viral genome. RESULTS: Protocols A and B generated 9,354,933 and 3,255,879 reads, respectively. Read length N50 values ranged between 6976 and 7360 nucleotides over the four sequencing runs. Bioinformatics analysis showed that both protocols allowed for the reconstruction of the whole viral genome, with pairwise percentages of identity to HPV-ICB2 of 100 % for protocol A and 99.98 % for protocol B. CONCLUSION: Our results show that the use of the MinION nanopore sequencer represents an effective strategy for whole-genome sequencing of HPVs with a minimal error rate

    Complete Genome Sequence of a Novel Human Gammapapillomavirus Isolated from Skin

    Full text link
    A novel human papillomavirus (HPV ICB1) was fully characterized from a skin swab by using a sensitive degenerate PCR protocol combined with next-generation sequencing. The L1 open reading frame of HPV ICB1 shares 70.54% nucleotide homology with its closest relative, HPV164, and thus constitutes a novel human gammapapillomavirus
    corecore